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摘要 : 大 粒 香 作为 贵州 重要 的 优质 稳 资 源 ， 推 广 种 植 面积 大 ， 且 在 乡村 振兴 过 程 中 为 社会 带 
来 了 较 高 的 经 济 效益 , 但 目前 对 大 粒 香 基因 组 学 理论 研究 报道 不 多 。 为 了 揭示 大 粒 香水 稻 叶 
绿 体 基 因 组 特征 及 系统 发 育 关 系 ， 该 文 对 大 粒 香 叶 绿 体 进 行 测序 ， 分 析 其 基因 组 特征 。 结 果 
表明 : (1) 大 粒 香水 稻 cpDNA 全 长 134 563 bp， 包 括 一 个 LSC (80864 bp) ， 一 个 SSC 
(12347 bp) 和 两 个 IRs (20676 bp) 。 (2) 注释 到 129 PER, NAS, (RNA 
fI rRNA 三 类 基因 ， 数 量 分 别 为 85 个 、36 个 和 8 个。 G) 密码 子 偏好 分 析 显 示 ， 大 粒 香 
cpDNA 密码 子 偏好 A 碱 基 或 者 U〈T) 碱 基 ， 亮 氨 酸 密码 子 使 用 了 1 944 kk, 最多; ERA 
酸 的 密码 子 仅 使 用 198 次 ， 最 少 。 (4) 检测 到 129 个 SSR， 其 中 有 95 个 单 核 音 酸 重 复 ， 且 
大 部 分 SSR 序列 由 A/T 碱 基 组 成 。 (5〉 系统 发 育 分 析 结 果 表 明 ， 大 粒 香 与 热带 粳稻 亲缘 关 
系 最 近 聚 为 一 类 。 该 研究 揭示 了 大 粒 香 叶 绿 体 基因 组 信息 ,并 确定 了 大 粒 香 系统 发 育 所 属 分 
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Analysis of chloroplast genome of rice Dalixiang 
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Abstract:As an important high-quality rice resource in Guizhou province, Dalixiang has a large 
planting area, and has brought higher economic benefits to society in the process of rural 
revitalization. However, there are few theoretical researches on the genomics of Dalixiang. In 
order to reveal the characteristics and phylogenetic relationships of chloroplast genome of large 
grain perfume rice, the chloroplasts of grancas fragrances were sequenced and their genomic 
characteristics were analyzed. The results were as follows: (1) The chloroplast genome of 
Dalixiang was 134 563 bp, including LSC(80 864 bp),SSC(12 347 bp)and two IRs(20 676 bp). (2) 
There were 129 genes annotated in the chloroplast genome of Dalixiang, which could be divided 
into protein coding, tRNA and rRNA, with 85, 36 and 8 genes respectively. (3) Codon bias 
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analysis of Dalixiang showed that leucine was most frequently used and that cysteine was used 
least frequently, and most codons ended in A/U(T). (4) The total number of SSR loci in the 
cpDNA of Dalixiang was 129, ninety-five of which are mononucleotide and most of SSR was 
composed of nucleobase A/T. (5) Phylogenetic analysis shows an affiliation relationship between 
Dalixiang and Tropical Japonica. This study reveals the characteristic information of Dalixiang 
chloroplast genome, and identifies the phylogenetic status of Dalixiang. 

Key word: rice,dalixiang, chloroplast genome, SSR, phyletic evolution 


叶绿体 是 植物 获取 能 量 的 重要 细胞 器 ， 有 着 独立 于 核 基因 组 的 遗传 体系 ,其 基因 序列 保 
让 ,基因 结构 重 排 事 件 远 低 于 核 基因 组 ,结构 简单 ,一 般 为 母系 遗传 ,因此 被 用 来 揭示 物种 的 进 
化 与 亲缘 关系 ( 李 绪 英 等 , 2011; Li et al., 2018; Zhang et al., 2018; Jeon & Kim., 2019; 朱 斌 等， 
2021) 。 由 于 测序 科技 的 发 达 ， 不 少 生物 实现 了 叶绿体 基因 组 测序 ，NCBI 中 收录 的 叶绿体 
基因 逐渐 增多 , 利用 叶绿体 基因 研究 亲缘 关系 的 报道 也 不 断 增多 。 在 水 稻 中 ,Fan SE (2020) 
利用 cpDNA 分 析 了 33 个 稻 属 物种 的 亲缘 关系 , 研究 显示 O. sativa voucherHSAGSDYD1802 
与 O. sativa cultivar TN1. O. sativa cultivar RP Bio-226 和 O. sativa cultivar IR8 的 亲缘 关系 最 
it. Fang 5$ (2017) 通过 分 析 cpDNA 探讨 了 根茎 野生 稳 与 其 他 13 个 稻 属 物种 的 杂 缘 关系 ， 
研究 显示 与 根茎 野生 稻 关 系 较 近 的 是 药 用 野生 稻 ， 且 属于 CC 基因 类 型 。 在 其 他 物种 中 ， 张 
HE (2018) 利用 cpDNA 分 析 了 益母草 及 其 他 16 个 物种 的 亲缘 关系 ， 研 究 结 果 很 好 的 解 
决 了 野 芝麻 亚 科 的 进化 关系 。 郑 神 等 (2020) 用 大 花 君 子 兰 叶绿体 基因 序列 与 10 个 百合 科 、 
5 个 兰 科 、4 个 意 尾 科 及 5 个 石 获 科 共 24 个 物种 的 叶绿体 基因 组 序列 进行 系统 发 育 分 析 , W 
究 结果 支持 大 花 君 子 兰 属于 石 菏 科 ， 并 且 使 用 其 中 23 个 物种 叶绿体 基因 组 中 ycf2 进行 亲缘 
关系 分 析 ， 发 现 叶 绿 体 基因 组 中 ycf2 可 以 代替 叶绿体 基因 组 全 长 进行 亲缘 关系 分 析 。 

大 粒 香 是 贵州 省 水 稻 研究 所 选 育 ， 具有 稻米 粒 大 且 香 特 点 ,并 且 大 粒 香 在 乡村 振兴 过 程 
中 为 社会 带 来 了 较 高 的 经 济 效益 〈 蒋 志 谦 ，2008; 罗 仁 发 等 ，2012) 。 目 前 ， 对 大 粒 
组 学 、 品 质 形成 等 理论 研究 的 文献 报道 不 多 。 基 于 大 粒 香 在 贵州 优质 稳 发 展 过 程 中 的 重要 性 ， 
为 进一步 从 基因 组 水 平 认识 和 改良 大 粒 香 ， 本 研究 ， 以 大 粒 香 DNA 为 材料 进行 测序 ， 构 建 
KHE cpDNA Hit, 分析 密 码 子 的 使 用 ， 重 复 序列 ， 分 析 亲 缘 关 系 ， 拟 揭示 大 粒 香 叶绿体 
基因 组 以 下 信息 : CD KAE cpDNA 的 基本 特征 大 小 。(2〉 大 粒 香 叶 绿 体 基因 密码 子 偏 
好 情况 。 G) 大 粒 香 叶 绿 体 基因 组 系统 发 育 所 属 分 支 。 
1 材料 与 方法 
1.1 试验 材料 

以 “大 粒 香 ” 为 试验 材料 ，2019 年 冬季 种 植 于 海南 三 亚 师 部 农场 基地 ，2020 年 2 月 选 
取 无 病虫害 、 长 势 良 好 的 水 稳 叶 片 ， 冲 洗 、 擦 干 液 氮 速冻 暂 存 ， 后 用 干冰 保存 寄 回 贵州 ， 置 
于 -80'C 保 存 ， 用 于 提取 大 粒 香 DNA. 
1.2 试验 方法 
1.2.1 KE DNA 提取 及 测序 
使 用 TIANGEN 植物 DNA 试剂 盒 提取 大 粒 香 总 DNA , 测序 公司 检测 合格 后 ,构建 文库 ， 
进行 测序 。 
1.2.2 叶绿体 基因 组 序列 组 装 与 注释 

将 原始 数据 ,除去 有 污染 、 低 质量 的 片段 ， 使 用 SPAdes 软件 拼接 ， 然 后 组 装 。 在 使 
CPGAVAS2 进行 基因 注释 ， 最 后 利用 OGDRAW 将 大 粒 香 的 叶绿体 基因 图 谱 绘 制 出 。 
1.2.3 密码 子 使 用 分 析 
使 用 CodonW 进行 密码 子 使 用 分 析 。 
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1.2.4 重复 序列 分 析 

使 用 vmatch 完成 大 粒 香 cpDNA 的 长 重复 序列 的 查找 。 大 粒 香 cpDNA 的 SSR 筛选 则 使 
用 MISA 软件 ， 该 软件 的 检测 参数 为 ， 单 核 昔 酸 大 于 8 时 被 检测 ，2 AERA 3 BRENT 
4 时 被 检测 。 
12.5 系统 进化 分 析 

为 探究 大 粒 香 与 其 他 稳 属 物种 的 亲缘 关系 ， 从 NCBI 中 下 载 了 12 个 稳 属 物种 和 2 种 禾 
本 科 近 源 物种 的 叶绿体 基因 组 ( 绿 竹 和 高 梁 ) ， 使 用 RaxML 软件 构建 系统 发 育 树 。 


2 结果 与 分 析 


2.1 大 粒 香 叶绿体 基因 组 序列 特征 

大 粒 香 cpDNA 全 长 为 134563 bp， 分 为 LSC (80 864 bp) ，GC & $73 37.09 %、SSC 
(12347 bp) ，GC 含量 为 33.37 % 和 IRs 区 (20 676 bp) ，GC 含量 为 44.41 %。 在 大 粒 香 
cpDNA 中 注释 129 个 基因 〈 表 1) ， 可 分 为 三 类 : 蛋白 编码 基因 、tRNA 基因 和 rRNA. 基因 ， 
其 数量 分 别 为 85、36 和 8。 其 基因 功能 主要 为 与 自身 复制 能 力 有 关 、 与 光合 作用 有 关 、 其 
他 关系 和 未 知 功能 有 关 等 四 种 。 在 蛋白 编码 基因 中 ,rps 基因 的 数量 最 多 有 16 个 ; 而 cemA、 
infA、ccsA、rbcL、matK、accD、clpP 等 基因 数量 仅 有 1 个 。 其 中 有 二 十 个 基因 出 现在 IR 
重复 区 内 ， 分 别 为 ndhB. ycfl. rpsl2. rpsT. rpsl5. rps9. rpl2. rpl23 等 八 个 蛋白 编码 基 
因 ; rrn23S . rrn4.5S. rrnl6S. rrn5S 等 4 个 核糖 体 RNA; 及 trnN-GUU.. trnH-GUG. trnA-UGC. 
tnL-CAA, trnT-CGU, tnV-GAC. trnR-ACG, trnM-CAU 等 8 个 转运 RNA (X 1) 
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1 大 粒 香 叶绿体 基因 组 图 谱 


Fig. 1 


Gene map ofDalixiang chloroplast genome 


RI 大 粒 香 叶绿体 基因 组 注释 基因 列表 


Table 1 List of genes found in Dalixiang chloroplast genome 


功能 基因 类 别 基因 名 称 
Function Gene category Gene Name 
光合 作用 光 系 统 I Photosystem I psaC.psal, psaB,psaJ, psaA 
Photosynthesis 、 sbL, psbD, psbN, psbB, psbT, psbH, psbE, psbA, psbl, 
á KA II Photosystem II P dá P á d P á P P 
psbK, psbJ, psbC,psbM,psbZ, psbF 
细胞 色素 bf 复合 体 Cytochromeb/fcomplex peta, petB, petD, petN, petG 
ATP 合 酶 ATPsynthase atpl, atpE ,atpA ,atpH, atpB, atpF 
"m ndhB*, ndhD, ndhE, ndhl, ndhF, ndhH, ndhG, ndhC, ndhK, 
NADH 脱氧 酶 NADH dehydrogenase 
ndhA, ndhJ 
核 酮 糖 -1,5- 二 磷酸 羧 化 酶 大 亚 基 
rbc 
RubisCO large subunit 
自我 复制 RNA RAM RNA polymerase rpoC1, rpoC2, rpoA, rpoB 
Self zi rps2, rps3, rpsl6, rpsll, rps4, rps19*, rps18, rpsl4, rps8, 
"NE 核糖 蛋白 小 亚 基 (SSU) 
replication rps7*, rpsl5*, rps12* 
核糖 蛋白 大 亚 基 (LSU) rpl20, rpl32, rpl36, rpl22, rpl23*, rpl16, rpI2*, rpl14, rpl33 
trnQ-UUG,trnV-UAC, trnN-GUU*, trnC-GCA, 
trnH-GUG*,trn T-UGU,trnA-UGC*,trnR-UCU,trnL-CAA*, 
= trnP-UGG, trnL-UAG, trnK-UUU,trnW-CCA, trnG-GCC, 
转运 RNAs TransferRNAs 
trnT-CGU*, trnN -GAC*, trnL-UAA, trnT-GGU, 
trnS-GCU, trnD-GUC, trnE-UUC, trn$-UGA, trnR-ACG*, 
trnF-GAA,trnY-GUA, trnS-GGA, trnS-CGA,trnM-CAU* 
核糖 体 RNAs Ribosomal RNAs rrn23S*, rrn4.5S*, rrnl6S*, rrn5S* 
其 他 基因 成 熟 酶 matKgene matK 
Other genes ABT 
3 ndn infA 
initiation factor 
合成 C 型 细胞 色素 的 基因 x 
ces 
c-type cytochrom synthesis gene 
乙酰 辅酶 A RAMY 
; accD 
Subunit of Acetyl-CoA-carboxylase 
MS Envelop membrane protein cemA 
蛋白 酶 Protease clpP 
未 知 功能 Rn 
保守 假定 阅读 杠 
Unknown | ; ycf1*, ycf3, ycf4 
: Conserved hypothetical reading frame 
function 


注 : 


Note: * indicates the gene is located in the inverted repeats. 
g p 


VAS 
少 


六 个 基因 只 有 
( 表 2) 。 


* 表 示 该 基因 位 于 反 向 重复 区 内 。 


统计 结果 显示 ， 大 粒 香 cpDNA 中 有 内 含 子 的 基因 
个 。 其 次 ,trnK-UUU 的 内 含 子 碱 基数 最 多 ， 而 trnL-UAA 的 内 含 子 碱 基数 最 


< 十 七 个 ， 其 中 yo 有 两 个 ， 剩 余 十 


表 2 ARA cpDNA 含有 内 含 子 的 基因 
Table 2 Genes with introns in the Dalixiang chloroplast genome 


名 称 FRETI AFI STO ARFI STI 
Name Exon I Intron I Exon II Intron II Exon III 
rpl2(x2) 393 661 427 

rpsi6 212 811 44 

rpl16 401 1 060 8 

trnT-CGU(x2) 31 929 58 

trnÃ-UGC(x2) 36 812 35 

trnS-CGA 61 662 30 

trnK-UUU 35 2 488 37 

trnV-UAC 52 929 31 

trnL-UAA 35 540 50 

ndhB(x2) 770 710 758 

ndhA 541 986 549 

atpF 159 814 406 

ych 155 728 229 743 123 


22 大 粒 香 叶 绿 体 基因 组 密码 子 使 用 分 析 
在 大 粒 香 cpDNA 密码 子 中 ， 亮 氨 酸 密码 子 使 用 了 1 944 次 ， 最 多 ; 半 胱 氢 酸 的 密码 子 
仅 使 用 198 次 ， 最 少 。 其 次 ， 在 编码 大 粒 香 cpDNA 的 密码 子 中 有 30 个 密码 子 偏好 性 >1， 
其 中 以 A 结尾 的 有 12 个 , UUT 结尾 的 有 16 个 , 这 表明 大 粒 香 cpDNA 密码 子 偏好 A/U 
(T) 碱 基 ， 这 种 情况 也 常常 出 现在 杜 梨 、 益 母 草 等 多 种 高 等 植物 中 〈 张 慧 等 ，2018; Am 
i^, 2020; XES, 2020 ( 表 3) 。 


表 3 大 粒 香 cpDNA 密码 子 使 用 
Table 3 Codon Usage in chloroplast genome of Dalixiang 


" -—- 密码 子 偏 密码 ei 密码 子 偏 

名 称 密码 子 KM 好 性 名 称 E 次 数 好 性 

Name Codon | Number Name Number 
RSCU Codon RSCU 

异 亮 氨 酸 AUU 730 1.51 Aii e GUU 400 1.56 

Isoleucine AUC 286 0.59 Valine GUC 115 0.45 

AUA 435 0.9 GUA 376 1.46 

HAR ACU 402 1.71 GUG 136 0.53 

Threonine ACC 179 0.76 KHAR GCU 489 1.74 

ACA 249 1.06 Alanine GCC 162 0.58 

ACG 108 0.46 GCA 331 1.18 


RAR AAA 638 1.47 GCG 142 0.51 


lysine 


天 冬 酰 胺 


Asparagine 


丝氨酸 


Serine 


HAR 
Arginine 


ERAR 
Methionine 


TAR 
Leucine 


231 


515 


193 
331 
254 
223 
110 
266 
88 


243 
100 
231 
85 
304 
108 
423 


657 
350 
423 
133 
272 
109 


2.03 
1.08 
1.31 
0.41 
0.84 
0.34 


AR 
Aspartic acid S 
AR 
Aspartic acid dn 
谷 氨 酸 GAA 
GAG 
甘氨酸 GGU 
Glycine GGC 
GGA 
GGG 
组 氨 酸 CAU 
Histidine CAC 
谷 氨 酰胺 CAA 
Glutamine CAG 
FAR UGU 
UGC 
ESSEN UUU 
Phenylalanine UUC 
EAR 
Tryptophan UGG 
Up UAU 
Tyrosine UAC 
MAR CCU 
Proline CCC 
CCA 
CCG 


508 1.56 
143 0.44 
697 1.47 
249 0.53 
415 1.26 
138 0.42 
514 1.56 
249 0.76 
299 1.5 
101 0.5 
476 1.51 
153 0.49 
150 1.52 
48 0.48 
646 1.29 
355 0.71 
329 1 

510 1.56 
142 0.44 
301 1.59 
167 0.88 
202 1.07 
88 0.46 


23 大 粒 香 叶 绿 体 基 因 组 长 重复 序列 和 SSR 分 析 


在 大 粒 香 cpDNA 中 检测 到 十 九 个 长 重复 序列 , E, 


bp， 以 及 十 一 个 回 文 重复 ， 


rps19-psbK 的 基因 间隔 区 内 ， 
示 绝 大 多 数 分 布 在 基因 


和 含有 最 多 长 


间隔 区 内 ( 表 4)。 


表 4 大 粒 香 cpDNA HE 


含 了 八 个 正 向 重复 , 长 度 范围 在 30~52 


E 复 序列 


Table 4 The cpDNA repeat sequence of Dalixiang 


wh 


其 长 度 范 围 在 30~127 bp。 最 长 的 127 bp 的 重复 序列 位 于 
E 复 序列 的 区 间 为 racL-accD. 


区 域 位 置 分 布 显 


序 大 小 类 型 ME 区 域 
^j (bp) Type Position Location 
No. Size 
1 52 ER) 56044 IGS(rbcL-accD) 
2 35 正 向 ”130 388 IGS(ndhB-trnL-CAA) 
3 32 IEH] 55 946 IGS(racL-accD) 
4 43 IER] 12917 IGS(trnG-GCC-trnT-GGU) 
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46 
38 
35 
30 
35 
35 
30 
46 
30 
32 
38 
52 
127 
30 
32 


E] FE REFER 


Im] Im] [m] [m] [m [qm] O e [mi 


Iz] 


a 


63 122 
56 005 
84 954 
86 451 
85 004 
84 954 
128 946 
63 122 
86 451 
55 946 
56 005 
56 044 
0 

66 243 
57 152 


Er af 


Er 


E PR A O E E X 


IGS(petA-petG) 
IGS(rbcL-accD) 
IGS(trnH-GUG-trnV-GAC) 
IGS(trnH-GUG-trnV-GAC) 
IGS(trnH-GUG-trnV-GAC) 
IGS(trnH-GUG-trnV-GAC) 
Intron(ndhB) 
IGS(petA-petG) 
IGS(trnH-GUG-trnV-GAC) 
IGS(racL-accD) 
IGS(racL-accD) 
IGS(racL-accD) 
IGS(rps19-psbK) 
CDS(rps18) 
IGS(accD-psal) 


ik: LSC. 大 单 拷贝 区 ; IGS. 基因 


间隔 区 ;， CDS. 基因 编码 区 。 


Note: LSC. Large single copy; GIS. Gene intergenic spacer; GCR. Gene coding region. 


在 大 粒 香 cpDNA 的 129 个 SSR 位 点 中 
或 工 组 成 , 表明 SSR 位 点 有 使 月 


j 95 个 单 核 音 酸 重 复 ,并 且 79.07 % 的 SSR 由 A 


H A/T 碱 基 的 偏好 。 同 时 研究 表明 SSR 位 点 在 大 粒 香 cpDNA 


上 分 布 不 均 ， 在 LSC K, SSC 区 以 及 IR 区 分 别 分 布 了 95、18 和 16 个 SSR 位 点 ( 表 5). 


表 5 大 粒 香 cpDNA 中 的 SSR 
Table 5 Distribution of SSR in the Dalixiang cpDNA 


序号 重复 类 型 简单 重复 序列 大 小 ME | 序号 重复 类 型 简单 重复 序列 大 小 ME 
No. Type SSR Size(bp) Location| No. Type SSR Size(bp) Location 

1 c (AA)s(A)i 11 LSC 44 c (TT)a(T)s 8 LSC 
2 c (A)s(AA)4 8 LSC 45 c (AA)4(A)s 8 LSC 
3 p2 (AG)s 10 LSC 46 c (A)o(AA)4 8 LSC 
4 c (A)1((AA)s 10 LSC 47 c (TT)a(T)s 8 LSC 
5 p4 (TAAA)4 16 LSC 48 c (Ds(TT)4 8 LSC 
6 c (A)s(AA)4 8 LSC 49 p2 (TA) 8 LSC 
7 c (A)s(AA)4 8 LSC 50 p2 (AT) 8 LSC 
8 c (A)o(AA)4 8 LSC 51 C (TT)s(T)10 10 LSC 
9 c (AA)«(A)s 8 LSC 52 c (AA)4(A)o 9 LSC 
10 c (TT)4(T)s 8 LSC 53 c (AA)4(A)s 8 LSC 
11 c (A)s(AA)4 8 LSC 54 p2 (AG)4 8 LSC 
12 p2 (AG) 8 LSC 55 c (TTTTS(TTT(TT)s(T)i2 12 LSC 
13 p2 (GA)4 8 LSC 56 c (C)s(CC)4 8 LSC 
14 c (TT)4(T)o 9 LSC 57 p4 (GTAG)4 16 LSC 
15 p4 (CTTT) 12 LSC 58 c (AA)4(A)s 8 LSC 
16 c (AA)«(A)s 8 LSC 59 c (TT)a(T)s 8 LSC 
17 c (TT)4(T)8 8 LSC 60 p4 (AATA); 12 LSC 
18 c (AA)4(A)s 8 LSC 61 c (T)o(TT)4 8 LSC 
19 pó (TTTCTA); 18 LSC 62 c (TT)4(T)o 9 LSC 
20 p6 (ATAGAA)3 18 LSC 63 c (A)e(AA)4 8 LSC 
21 c (AA)«(A)s 8 LSC 64 c (AA)4(A)s 8 LSC 


(AAJA) 
(AT)s 
(AT) 

(TT)a(T)s 

(A)s(AA)4 

(AA) (A)s 

(AA)4(A)s 

(A)u(AA)s 

(A)s(AA)4 
(AT) 
(AT) 

(TT)a(T)s 
(D«(TT)4 
(T)s(TT)4 

(AA)a(A)s 

(AA)4(A)s 

(A)e(AA)4 

(TTT) 
(CT)s 
(TT)a(T)s 
(TT)A(T)o 
(T)s(TT)4 
(T)(TT)4 
(T)s(TT)4 


ND O OO co co O OO CO OO OO 


= 
© 


o O OO NO oco 


LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 


65 
66 
67 
68 
69 
70 
71 
72 
73 
74 
75 
76 
77 
78 
79 
80 
81 
82 
83 
84 
85 
86 
109 
110 


(TT)a(T)s 
(AA)4(A)s 
(AA)4(A)s 
(TT)a(T)s 
(AA)4(A)s 
(AA)4(A)s 
(A)s(AA)4 
(TT) Te 
(T)io(TT)s 
(TA) 
(TA) 
(AGAA); 
(TT) Te 
(AJ(AA)4 
(TTTA); 
(AA)4(A)s 
(Dio(TT)s 
(A)io(AA)s 
(T)io(TT)s 
(T«(TT)4 
(TTT) 
(DTT)s 
(TAT) 
(D«(TT)4 


oo O OO OO O OO OO OO 


pi 
[-] 


LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
LSC 
IRB 
LSC 
SSC 
SSC 


89 c (TT)a(T)s 8 LSC | 111 p2 (TO); 10 SSC 


90 p3 (ICT) 12 LSC | 112 c (A)s(AA)a 8 SSC 
91 c (Du(TT; 10 LSC | 113 c (AA)4(A)s 8 SSC 
92 c (TS(TT)4 8 LSC | 114 c (CC)4(C)9 9 IRA 
93 c (A)sg(AA)4 8 LSC | 115 c (G)(GG) 8 IRA 
94 p2 (AG) 8 LSC | 116 p2 (CT). 8 IRA 
95 c (TT)s(T)io 10 LSC | 117 p2 (GA) 8 IRA 
96 c (TT Ts 8 SSC | 118 p4 (AACG); 12 IRA 
97 c (A)s(AA)4 8 SSC | 119 c (AA)4(A)s 8 IRA 
98 c (TTUT) 9 ssc | 120 c — (TTTD4T)s&(TTTTTS(TTT)(TTs 16 LSC 
99 c (A)s(AA)4 8 SSC | 121 p4 (TCGT); 12 IRs 
100 c (A)s(AA)4 8 SSC | 122 p2 (TC). 8 IRs 
101 c (A)s(AA)4 8 SSC | 123 p2 (AG) 8 IRs 
102 c (A)sg(AA)4 8 SSC | 124 c (Cs(CC)4 8 IRs 
103 c (AA)4(A)s 8 SSC | 125 c (G)(GG) 8 IRs 
104 p4 (AACA); 12 SSC | 126 c (A)io(AA)s 10 — IRs 
105 c (A)s(AA)4 8 SSC | 127 p2 (CT). 8 IRB 
106  p4 (AATA); 12 SSC | 128 c (CTT)4T)s 8 IRs 
107 c (COAC)s 8 SSC | 129 c (AA)4(A)s 8 IRB 
108 c (A)s(AA)4 8 SSC 


iE: e. 单 碱 基 ; p2. 2 碱 基 单 元 ，p3. 3 碱 基 单元 ，P4. 4 碱 基 单元 P6. 6 碱 基 单 元 ; LSC. 大 单 拷贝 序列 ; SSC. 小 单 拷贝 序列 ;JIRA. IEIE 


Jj; IRB. 反 向 重复 序列 。 
Note:c. Dinucleotide; p3. Trinucleotide; P4. Tetranucleotide; P6. hexanucleotide; LSC. large single copy; SSC. small single copy; IR. inverted repeats. 
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2.4 大 粒 香 叶绿体 基因 组 系统 发 育 分 析 

将 大 粒 香 与 粳稻 、 首 稻 、 野 生 稳 及 2 个 外 类 物种 等 共 15 个 叶绿体 基因 组 序列 构建 发 育 
树 。 发 育 树 分 析 表 明 , 15 个 物种 可 分 为 3 E, 第 一 类 为 Bambusa oldhamii, 第 二 类 为 Sorghum 
bicolor， 第 三 类 为 13 个 稻 属 物种 组 成 。 在 第 三 类 群 中 又 可 分 为 4 个 小 类 群 ,三 种 野生 稻 〈O. 
australiensis 300316. O. meridionalis, O. ruifipogon) 各 为 一 类 ， 其 余 10 种 栽培 稻 为 一 类 。 
在 栽培 稻 类 和 群 中 ， 粳 稻 与 籼稻 分 别处 于 不 同 进化 分 支 。 其 次 ， 大 粒 香 水 稻 与 粳稻 Tropical 
Japonica 在 同一 分 支 ， 表 明 两 者 的 进化 关系 比 其 他 水 稳 品种 近 (图 2) 。 


- Oryza sativa TRY 台中 1 号 NC 031333.1 


81 O.sativabasmatic 巴 斯 玛 蒂 KT289403.1 
O. sativa Indica93-M 93-11 — AY522329.1 
100 
O. sativa Indica 籼稻 NC 008155.1 


js O. nivara “一 年 生 普通 野生 稻 NC 005973.1 
O. sativa Jingeng818 FFP 818 MK348618.1 


68 O. sativa Japonica PA64S PA64S AY522331.1 
100 
88 O. sativa Japonica Nipponbare 日 本 晴 KM088016.1 


O. sativa Tropical Japonica XEFE KT289404.1 
w i DLX 大粒 香 


- O.mfipogon ”普通 野生 稻 ”NC 017835.1 
O. meridionalis ”南方 野生 稻 “NC_016927.1 
- O. australiensis 300136 ”澳洲 野生 稻 300136 GU592209.1 
Sorghum bicolor sk NC 008602.1 


Bambusa oldhamii 4147 NC 012927.1 


图 2 15 种 植物 的 叶绿体 基因 组 序列 的 系统 进化 树 
Fig. 2 Phylogenetic tree constructed using chloroplast genome of 15 plants 


3 讨论 与 结论 


本 研究 测 得 大 粒 香 叶绿体 基因 组 全 长 为 134 563 bp, GC 含量 为 39 %,LSC 为 80 864 bp, 
SSC 为 12347 bp, IR 为 20 676 bp， 并 注释 到 129 个 基因 ， 与 已 报道 的 禾 本 科 数 据 相 符 〈 李 
裕 华 等 ，2020) 。 前 人 通过 比 对 不 同 禾 本 科 植 物 叶 绿 体 基因 组 序列 表明 ， 叶绿体 基因 保守 程 
度 较 高 ， 但 一 些 基因 在 进化 过 程 中 仍然 出 现 退 化 缺失 现象 〈 唐 萍 等 ，2011; 付 涛 等 ，2016 ) 。 
本 研究 将 大 粒 香 叶 绿 体 基因 组 与 Wang E (2016) 报道 的 热带 粳稻 叶绿体 基因 组 进行 比 对 ， 
结果 显示 二 者 在 细胞 色素 bf 复合 体 相关 基因 、 光 系统 I 、 开 相关 基因 、 核 糖 体 蛋白 大 和 人 小 
亚 基 相关 基因 、tRNA 和 未 知 功能 基因 等 基因 差异 较 少 ， 但 在 大 粒 香 叶绿体 基因 中 不 存在 
IhbA 基因 。IhbA 基因 是 和 光合 作用 过 程 中 光 系 统 工 有 关 的 基因 , 在 热带 粳稻 中 存在 INDA 基 
因 ， 并 且 在 喜好 温暖 的 禾 本 科 植 物 毛 竹中 同样 也 存在 INDA 基因 (Xin et al,2016) ， 这 可 能 
是 热带 粳稻 为 适应 热带 光 温 生长 环境 中 逐渐 进化 而 得 。 


e 


3 


结构 稳定 、 易 测序 等 优点 ， 有 助 于 解决 类 群 间 的 遗传 多 样 性 (Powell et al., 1995; Pugh et al., 


SSR 位 点 可 被 用 于 辅助 育种 和 遗传 连锁 作 图 等 方面 的 


究 ， 而 cpDNA 具有 序列 保守 、 


2004;Song et al., 2019) 。 首 先 ,本 研究 结果 表明 大 粒 香 cpDNA 的 SSR 位 点 对 A/U CT) 碱 基 
有 着 明显 偏好 ， 这 与 前 人 研究 结论 相 一 致 〈 张 慧 等 ,2018; 李 泳 潭 等 ，2020; 郑 福 等 ，2020; 
王 一 磨 等 ，2021; 吴 朝 昕 等 ，2021) 。 其 次 ， 大 粒 香 cpDNA 的 密码 子 也 偏好 AU CT) 碱 
基 ， 这 种 密码 子 使 用 情况 也 存在 于 其 他 物种 中 (Shinozaki et al., 1986;Ohyama et al., 1988; 
FE, 2020; AIRE, 2021; 吴 朝 昕 等 ， 2021) 。 大 粒 香 cpDNA 编码 和 蛋白质 的 密码 子 和 SSR 
位 点 都 偏好 A 碱 基 或 者 UT) 碱 基 ， 可 能 是 造成 大 粒 香 cpDNA 总 AU (T) 含量 大 于 总 
GC 含量 的 原因 。 根 据 Niu 等 (2007) 的 研究 报道 ,A/T CHEER 7 个 氮 原 子 ， 比 G/C EGET 
酸 少 一 个 ,所 以 富 含 AT 核 苷 酸 耗 能 更 少 , 有 利于 cpDNA 的 复制 .这 也 可 能 是 大 粒 香 cpDNA 
TE A/U (T) 的 原因 。 

系统 发 育 基因 组 学 是 利用 分 子 数据 研究 生物 间 发 育 关 系 。cpDNA 的 具有 序列 保守 ， 结 
构 稳 定 , 易 测序 等 优点 , 因此 基于 cpDNA 进行 的 系统 发 育 研 究 得 到 很 好 的 发 展 (Eisen.,1998; 
Eisen &Hanawalt,1999; Delsuc et al., 2005) 。 本 研究 对 优质 稻 大 粒 香 叶 绿 体 基因 组 测序 数据 
进行 系统 发 育 分 析 , 研究 表 明 大 粒 香 与 热带 粳稻 聚 为 一 类 ; 粳稻 与 籼稻 不 为 一 类 ， 这 一 结果 
与 林 张 翔 等 (2014) 的 研究 结果 相同 ， 支 持 了 Huang 等 (2012) 的 籼 粳 稳 起 源 假说 。 

综 上 所 述 ， 本 研究 获得 的 大 粒 香 的 叶绿体 基因 组 大 小 、 结 构 、 基 因数 量 、 重 复 序列 、 密 
码 子 偏好 、 系 统 发 育 树 等 特征 信息 , 将 为 进一步 研究 大 粒 香 的 系统 进化 和 育种 研究 提供 理论 
依据 。 
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